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摘 要 :为 满足 航天 大 容量 存储 系统 对 高 速 存储 及 数据 完整 的 需求 ,实现 了 一 个 基于 NAND 型 内 存 的 高 
性 能 控制 器 ,提出 了 一 种 实现 于 NAND 型 内 存 芯 片 内 部 的 流水 编程 机 制 , 以 及 一 种 可 以 保证 数据 无 缝 连接 的 
坏 块 处 理 机 制 。 介 绍 了 存储 控制 器 的 各 个 模块 设计 ,并 分 析 了 不 同情 况 编程 机 制 所 需 的 时 间 计 算 方 法 ,建立 
仿真 模型 ,利用 蒙特 卡 洛 方法 仿真 并 讨论 了 流水 编程 机 制 的 性 能 优化 效果 。 在 实际 硬件 平台 验证 了 流水 编 
程 机 制 和 坏 块 处 理 机 制 , 结 果 表 明 该 大 容量 存储 系统 的 存储 速率 可 达 100MB/s, 读 取 数 据 与 存 人 数据 保持 一 
致 ,数据 无 乱 序 无 丢失 。 
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Design and implement of a NAND Flash controller with 
pipelining program and non-missing invalid block handle method 
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Abstract: Aiming at requirement of high speed and complete of data in space storage system, the design of a high performance NAND Flash 


controller js present. It concludes a pipelining-programming inside of NAND Flash chip and a non-missing invalid block method. The storage 


implementation is present. The calculation of storage time in different situation is discussed. The simulation modules are present and the impact of 


pipelining programming is simulated and discussed using Monte Carlo method. Practical application proves the pipelining programming and non-missing 


invalid block method. The operation frequency of storage system achieves to 100MB/s, ensuring accuracy, completeness and continuity of data. 
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近年 来 , 随 着 航天 领域 对 大 容量 存储 器 研制 
工作 的 不 断 发 展 , 与 非 型 内 速 存 储 器 ( no-and 
flash,NAND Flash) 作为 一 种 新 兴 的 半导体 存储 介 
质 ,以 其 高 密度 .大 容量 、 高 数据 存储 速率 以 及 可 
多 次 擦 除 等 特点 得 到 了 大 量 的 使 用 , 逐步 成 为 航 
天 电子 系统 存储 介质 的 主流 选择 *“ 。 文 献 日 
基于 NAND Flash 设计 了 一 种 高 速 海量 存储 模块 ， 
为 提高 存储 带宽 引入 了 并 行 技 术 , 同 时 在 时 间 和 
空间 上 对 存储 架构 进行 了 优化 ; 文献 印 设计 了 
一 种 高 速 多 通道 并 行 存储 架构 ,在 文献 B 的 基 
础 上 对 闪存 转换 层 算法 进行 了 优化 ,最 大 存储 速 
度 达 到 73MB/s。 高 速 系统 的 设计 基本 通过 
扩展 位 宽 或 使 用 多 片 Flash 芯片 进行 流水 线 操作 
来 提高 存储 系统 的 存储 速率 ,但 Flash 芯片 内 部 


* ” 收 稿 日 期 :2014 -06 -30 


流水 操作 的 设计 尚未 提出 ,并 且 存 储 速率 会 因 系 
统 的 时 钟 频 率 的 不 同 而 改变 。 本 设计 利用 了 
NAND Flash 多 片 又 装 结构 、 复 用 自主 固化 时 间 ， 
实现 了 Flash 芯片 内 流水 编程 机 制 的 设计 ,最 大 
存储 速度 达到 100MB/s, 并 分 析 了 编程 时 间 的 理 
论 值 ,对 流水 编程 机 制 的 性 能 优化 程度 进行 了 建 
模仿 真 ,分 析 了 流水 编程 机 制 在 不 同时 钟 频率 下 
对 系统 性 能 的 影响 。 

由 于 其 制造 工艺 和 航天 器 的 特殊 使 用 环境 等 
因素 ,NAND Flash 可 能 在 任意 地 址 存在 坏 块 ,并 
在 使 用 过 程 中 产生 新 的 坏 块 ”" ,对 坏 块 的 处 理 
是 NAND Flash 实际 应 用 中 必须 要 解决 的 问题 。 
大 量 的 Flash 使 用 实例 中 已 出 现 常见 的 坏 块 
处 理 方 法 ,主要 是 在 使 用 前 建立 坏 块 信息 表 , 以 此 
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来 检索 有 效 块 ,屏蔽 坏 块 。 根 据 坏 块 信息 表 建 立 
方式 可 以 分 为 两 类 :1) 直接 存储 , 即 只 存储 有 
效 块 的 地 址 ,剔除 无 效 块 地 址 ; 2) 间接 映射 , 即 在 
块 信息 表 空 间 相 应 的 地 址 进行 标记 , 以 此 来 判断 
对 应 块 的 性 质 。 根 据 坏 块 存储 区 域 可 以 分 为 : 控 
制 器 内 部 存储 以 及 Flash 页 内 存储 ,后 者 可 以 节 
约 控制 器 资源 , 但 访问 块 信息 表 的 时 间 过 长 ,不 适 
合 于 高 速 系统 。 另 外 ,还 有 基于 文件 分 配 表 ( File 
Allocation Table,FAT) 文件 系统 处 理 坏 块 方法 , 软 
件 操作 却 存在 一 定 难度 ”。 上 述 已 实现 的 坏 块 
处 理 方 法 能 屏蔽 已 知 坏 块 ,但 在 新 坏 块 产生 后 会 
丢弃 整个 坏 块 ,并 未 涉及 对 坏 块 内 已 存 数据 的 恢 
复 处 理 , 一 旦 在 编程 操作 中 出 现 坏 块 就 会 丢失 数 
据 , 最 坏 情 况 是 丢失 一 个 块 容量 的 数据 。 本 文 设 
计 了 一 种 数据 无 颖 连接 的 坏 块 处 理 机 制 ,在 使 用 
过 程 中 产生 新 的 坏 块 时 能 够 使 数据 恢复 ,保证 数 
据 完整 性 。 结 合流 水 编程 机 制 和 坏 块 处 理 机 制 |， 
本 设计 实现 的 大 容量 存储 系统 提高 了 整体 性 能 ， 
满足 实际 航天 电子 系统 对 高 速 存储 、 数 据 完整 无 
丢失 的 要 求 "2 。 


1 NAND Flash 控制 器 整体 设计 


本 设计 中 的 NAND Flash 控制 器 内 部 分 为 初 
始 化 、 探 除 、 编 程 `. 读 取 、 标 记 以 及 主 控制 器 六 个 模 
块 。 如 图 1 所 示 , 系 统 上 电 后 自动 进入 初始 化 模 
块 ,初始 化 模块 的 任务 是 读 取 所 有 的 Flash 块 的 
坏 块 标记 字 节 以 及 Spare 区 域 的 用 户 使 用 信息 ， 
生成 形成 完备 的 块 信息 表 , 后 续 存储 系统 的 全 部 
工作 都 将 根据 块 信息 表 来 执行 。 本 设计 为 达到 存 
储 系 统 对 高 速率 的 要 求 ,必须 减少 读 取 块 信息 表 
所 需 的 时 钟 周 期 , 因此 选择 在 控制 器 内 部 建立 
RAM 区 用 来 存放 坏 块 信息 表 。 对 Flash 的 基本 操 
作 有 编程 、 读 取 和 擦 除 , 三 种 操作 各 自 为 一 个 模 
块 。 另 外 ,标记 模块 就 是 根据 擦 除 模 块 和 编程 模 
块 提供 的 坏 块 地 址 对 坏 块 进行 标记 , 主 控制 器 模 
块 则 控制 协调 所 有 子 模块 的 工作 。 

编程 和 读 取 操作 的 基本 单位 为 页 ,每 次 编程 
读 取 操 作 存 储 、 读 取 一 页 容量 的 数据 以 及 使 用 信 
息 。 编 程 操 作 模 块 中 ,为 了 提高 存储 系统 的 整体 
编程 速率 ,利用 了 流水 操作 的 方法 在 片 内 实现 了 
流水 编程 操作 , 并且 能 入 了 完备 的 坏 块 处理 机 制 
用 于 处 理 编程 操作 中 产生 坏 块 的 数据 丢失 问题 ， 
编程 模块 将 在 下 文 详 述 。 读 取 模 块 会 在 接收 到 读 
取 指 邻 后, 按照 顺序 从 Flash 相应 页 地 址 中 将 数 
据 读 出 发 送 给 接收 器 件 。Flash 存储 单元 在 执行 
数据 写 入 之 前 需要 进行 擦 除 操 作 , 探 除 模块 完成 


旋 册 煞 据 
读 取 模 块 | ” 读 操作 完成 
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标记 完成 擦 除 模块 
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1 控制 器 模块 组 成 示意 图 
Fig.1 Modules of controller 

以 块 为 单位 的 探 除 操作 , 探 除 操作 可 能 导致 新 的 
坏 块 产生 ,此 时 需要 居 用 标记 模块 对 坏 块 进行 标 
记 。 擦 除 操作 实际 上 是 将 把 整 块 Flash 的 全 部 字 
节 单 元 恢复 为 “FF”, 即 把 所 有 的 位 全 部 恢复 为 
“1”。 编 程 操作 则 是 将 字 节 单元 中 相应 的 位 从 
所 ” 置 为 0”, 以 此 将 每 个 字 节 编程 为 相应 的 十 六 
进 制 数 " 。 而 坏 块 的 常见 情况 是 无 法 将 字 节 单 
元 里 的 “1 ” 值 置 为 ”或 者 无 法 将 人 0 ”的 位 恢复 
为 4”, 对 坏 块 进行 编程 操作 ,将 导致 存 入 数据 与 
实际 编程 成 功 的 数据 不 一 致 , 读 出 错误 数据 ,故而 
对 Flash 的 使 用 要 避免 使 用 坏 块 。 


2 流水 编程 机 制 的 设计 


2.1 NAND Flash 功 装 芯片 的 结构 特点 

NAND Flash 芯片 内 部 架构 为 多 片 Flash 晶片 
翅 装 ,本 设计 选用 8 片 又 装 式 的 Flash 芯片 ,每 单 
片 Flash 包含 4096 个 块 ,1 块 (block) 包含 64 页 
( page) ,1 页 包含 2048 字 节 数据 区 以 及 64 字 节 
Spare 区 , 其 中 每 页 的 数据 区 用 于 存放 数据 ,Spare 
区 则 是 提供 给 用 户 存 放 使 用 信息 "3 。 
Electronics 的 型 号 为 K9K8G08U1LA 的 Flash 芯片 
的 架构 图 如 图 2 所 示 。8 个 单 片 Flash 共用 的 信 
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2 NAND Flash 8 片 双 装 内 部 示意 图 
Fig.2 8 slides inside of NAND Flash 


号 有 : 指令 锁 存 使 能 信号 ( CLE) 、 地 址 锁 存 使 能 信 
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号 ( ALE) 和 一 组 8 位 的 1/0 接口 。 其 他 控制 信号 
包括 CE、RE、WE、R/B 则 是 8 片 Flash 各 有 一 组 。 
片 选 信号 CE 用 于 激活 8 片 Flash 晶片 中 的 某 一 
片 , 使 得 共用 信号 与 其 连接 ,流水 操作 就 是 利用 片 
选 信号 依次 激活 内 部 分 立 瑟 装 的 Flash 晶片 ,将 
自主 固化 时 间 得 以 复 用 来 提高 存储 系统 的 整体 编 
程 效率 。 
2.2 流水 编程 机 制 设 计 

根据 Flash 的 编程 操作 时 序 , 控制 某 一 片 
Flash 某 一 页 进行 编程 时 需要 对 Flash 芯片 的 操作 
如 下 : 1) 发 送 起 始 指 信和 地 址 ; 2) 加 载 2048 字 节 
数据 和 Spare 区 的 若干 字 节 使 用 信息 ; 3) 发 送 结 
束 指令 ”。 每 一 片 Flash 芯片 内 部 都 有 一 个 数据 
缓存 区 ,可 以 用 于 缓存 一 页 最 大 容量 的 数据 ,控制 
器 向 Flash 加 载 的 数据 实际 上 是 暂 存在 数据 缓存 
区 里 , 当 接 收 到 结束 指使 后 , Flash 进入 自主 固化 
阶段 ,将 数据 缓存 区 的 数据 按 顺 序 固化 到 当前 物 
理 地 址 指向 的 页 空间 中 。 在 Flash 芯片 的 自主 固 
化 时 间 内 ,控制 器 无 须 对 该 片 Flash 进行 控制 操 
作 , 连 接 该 片 Flash 的 所 有 信号 处 于 闲置 状态 。 
根据 Flash 厂家 提供 的 数据 显示 , Flash 固化 时 间 
的 典型 值 约 为 300 hs, 最 大 值 为 700 hs 日 。 如 果 
不 采用 流水 编程 机 制 , 对 Flash 的 所 有 页 空间 进 
行 普通 编程 , 写 入 每 一 页 数据 都 需要 等 待 Flash 
自主 固化 完成 ,使 得 存储 系统 的 整体 编程 效率 低 ， 
无 法 实现 高 速 存储 的 目的 。 因 此 本 设计 引入 流水 
操作 概念 ,在 多 片 埃 装 式 NAND Flash 芯片 内 实现 
了 流水 编程 机 制 , 大 幅度 地 提高 存储 系统 的 整体 
编程 速率 " 。 

本 设计 对 8 片 琶 装 的 Flash 芯片 采取 流水 方 
式 进行 编程 操作 ,每 次 对 8 片 Flash 的 同一 逻辑 
块 地 址 的 同一 页 进行 编程 操作 , 并 将 此 称 为 一 个 
流水 级 。CE0 ~ CE7 为 8 片 Flash 对 应 的 片 选 使 
能 信号 ,为 了 叙述 简便 ,将 8 片 Flash 单 片 分 别 定 
义 为 CE0 ~ CE7 。 每 个 流水 级 的 控制 器 操作 包括 
两 部 分 。1) 控制 编程 操作 部 分 : 依次 对 CE0 到 
CE7 发 送 起 始 指 邻 并 加 载 数据 ,使 得 8 片 Flash 芯 
片 依次 进入 自主 固化 阶段 。2) 编程 完成 情况 检 
测 部 分 : 编程 操作 完成 之 后 需要 对 编程 完成 的 状 
态 进行 检测 ,依次 对 CE0 到 CE7 已 完成 编程 操作 
的 芯片 发 送 检测 指令 ,根据 芯片 返回 状态 判断 是 
否 产生 新 的 坏 块 。 如 果 检 测 某 一 片 Flash 时 该 片 
仍 处 于 自主 固化 阶段 , 则 需要 等 待 其 固化 完成 后 
再 进行 状态 检测 。 流 水 编程 工作 顺序 如 图 3 所 
示 。 当 CE0 ~ CE7 全 部 检测 到 编程 成 功 , 则 一 个 


流水 级 的 编程 工作 完成 ” 。 


DD 固化 [| 画 化 后 必需 时 间 
图 3 流水 编程 工作 顺序 示意 图 


Fig.3 Pipelining-programming method 


2.3 系统 编程 所 用 时 间 的 计算 方法 

为 了 从 理论 上 验证 流水 编程 机 制 对 存储 系统 
性 能 的 改善 ,分 析 了 不 同情 况 下 编程 时 间 的 计算 
方法 ,建立 了 模型 对 此 进行 了 仿真 ,并 且 讨论 了 存 
储 系统 时 钟 频 率 的 不 同 、 自 主 固 化 时 间 的 不 稳定 ， 
对 流水 编程 机 制 的 性 能 影响 。 

设 固化 前 发 送 指令 和 数据 的 时 间 为 ,固化 
后 发 送 检查 指 信 和 状态 返回 时 间 为 ,自主 固化 
时 间 为 Z, 则 第 i 片 Flash 固化 时 间 可 以 表示 
为 X,。 

若 不 采用 流水 编程 机 制 , 则 8 次 页 编程 完 
的 时 间 7, 可 以 表示 为 : 

RR (1) 

其 中 , 沪 表示 第 i 片 Flash 的 固化 时 间 ,i =0， 
1,…,7;a,b 分 别 表示 固化 前 控制 必需 时 间 和 固 
化 后 控制 必需 时 间 。 

若 采 用 流水 编程 机 制 , 则 8 片 Flash 页 编程 
完成 的 时 间 7 可 以 表示 为 : 

8xa+8 xb, VX,<Y. 
le xa+X;+(8-)) xb, VX,=7Y, (2 
其 中 ,Y,=(7-i) xa+t+(i+ta) xb ,i=0,1,…,7; 
命 Z=X +(j+1) xa,X 为 Z, 取得 最 大 值 时 对 
应 的 X 值 。 

当 X,<Y, 对 于 所 有 的 X; 都 成 立时 , 很 明显 
看 出 7, 比 7, 节省 了 所 有 的 固化 时 间 。 当 X; <Y, 
不 能 全 部 X, 成 立时 , 式 (2) 得 出 7 的 取 值 由 X 以 
及 X; 处 于 流水 级 中 的 位 置 联合 决定 ,为 准确 直观 
地 表现 流水 编程 机 制 的 性 能 优化 程度 ,根据 上 述 
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理论 分 析 建 立 了 仿真 模型 ,采用 不 同时 钟 频率 以 CR 
及 不 同 自 主 固化 时 间 进 行 了 仿真 测试 ,结果 将 在 E 
i 依次 向 CEn 发 送 指令 、 
下 文中 进行 讨论 。 地 址 、 数 据 
3 无 缝 连接 式 坏 块 奉 代 机 制 A | 
3. 1 坏 块 产生 对 编程 的 影响 选中 相应 数据 备份 区 域 | 
Flash 在 使 用 过 程 中 会 随机 产生 新 的 坏 块 , 纺 ee 向 着 代 地 址 发 送 指令 、 
程 操 作 和 擦 除 操作 都 会 导致 坏 块 产生 -3 ,其 中 放风 和 
擦 除 操作 产生 的 坏 块 只 需要 对 该 坏 块 进行 标记 并 总 > 
及 时 更 新 块 信息 表 将 其 屏蔽 , 但 是 编程 操作 产生 自主 图 化 ? 
的 坏 块 涉及 到 数据 的 完整 性 以 及 数据 读 取 的 连续 [Ye 
性 ,需要 提出 一 个 处 理 机 制 来 应 对 编程 操作 产生 闫 读 取 固化 状态 指令 | 
的 坏 块 。 固 化 完成 后 Flash 接收 状态 读 取 指令 ， 


若 状 态 显 示 为 编程 失败 ,表明 当前 页 的 数据 没有 
正常 导入 , 称 该 页 为 编程 失败 页 。 编 程 失 败 页 中 
的 数据 为 无 效 数 据 ,不 能 作为 有 效 数 据 直 接 读 取 ， 
加 载 到 该 页 的 数据 将 丢失 。 编 程 失 败 页 所 在 的 块 
为 编程 失败 块 , 即 新 出 现 的 坏 块 , 若 直接 将 编程 失 
败 块 屏 巩 不 再 使 用 将 导致 已 正常 编程 页 的 数据 全 
部 丢失 ,最 坏 情况 会 丢失 整个 块 容量 的 数据 ,将 导 
致 整个 存储 系统 的 数据 丢失 情况 严重 加 剧 。 为 了 
保证 数据 不 丢失 ,本 设计 提出 了 一 个 无 颖 连接 的 
坏 块 处 理 机 制 ,流水 编程 机 制 ,能 够 在 高 速 编程 过 
程 中 实现 完备 的 坏 块 处 理 。 
3.2 坏 块 处 理 机 制 的 设计 

在 本 设计 中 ,如 果 8 片 Flash 的 页 编程 操作 
都 成 功 , 则 称 这 一 级 流水 编程 成 功 ; 若 有 某 一 个 
Flash 晶片 的 页 编程 操作 失败 则 称 该 流水 级 编程 
失败 ,开始 调用 坏 块 蔡 代 机 制 。 流 水 编程 的 替代 
机 制 具 体 流程 如 图 4 所 示 。 

无 颖 连接 坏 块 处 理 机 制 的 具体 设计 涉及 到 数 
据 备份 和 Flash 编程 操作 地 址 。 为 了 保证 不 丢失 
编程 失败 页 中 的 数据 ,需要 进行 数据 备份 ,在 控制 
器 内 部 例 化 出 RAM 空间 分 区 后 用 于 数据 备份 。 
当 执行 数据 加 载 工作 时 ,同时 将 数据 写 入 到 对 应 
的 RAM 区 里 。 发 生 页 编程 失败 后 , 调用 相应 的 
RAM 区 里 的 数据 再 次 写 入 到 替代 块 的 替代 页 中 。 
只 有 在 确保 RAM 区 里 的 数据 编程 成 功 之 后 才能 
允许 数据 被 覆盖 。 

Flash 编程 的 地 址 指向 即将 执行 编程 操作 的 
页 单元 ,页 地 址 在 每 次 编程 完成 后 加 一 指向 下 一 
页 ; 当 64 页 全 部 写 满 时 提取 新 的 块 地 址 , 块 地 址 
需要 检索 初始 化 生成 的 块 信息 表 得 到 。 本 设计 提 
出 逻辑 块 地 址 概念 ,对 存 有 数据 的 物理 块 标记 上 
逻辑 块 地 址 , 作为 有 效 块 的 顺序 。 发 生 页 编程 失 


司 化 成 功 ?> NO 


4 ”流水 编程 替代 机 制 流程 图 
Fig.4 Invalid block in pipelining programming method 
败 的 坏 块 和 该 坏 块 的 替代 块 拥有 同一 个 逻辑 块 地 
址 ,替代 块 的 第 一 个 编程 的 页 地 址 为 坏 块 中 编程 
失败 的 页 地 址 。 使 得 坏 块 与 替代 块 无 缝 连 接 后 ， 
相当 于 一 个 有 效 块 ,在 后 续 的 数据 读 取 工作 中 , 根 
据 唯 一 的 逻辑 块 地 址 可 以 顺序 回放 出 存储 的 
数据 。 
3.3 ”数据 的 读 取 顺序 处 理 
数据 的 读 取 顺 序 将 结合 流水 编程 机 制 索 引 风 
辑 块 地 址 得 到 。 将 每 一 页 的 数据 看 成 一 个 包 , 设 
第 n 包 存 放 在 第 4 片 ,第 B(2) 块 的 第 C 页 ,B 表 
示 物 理 块 地 址 , 为 逻辑 块 地址 。 第 n 包 数 据 的 
存放 地 址 可 表示 为 : 
n=(A+1) +8 x64x(B+1) +8x(C+1) 
(3) 
如 果 不 产 生 坏 块 , 则 8 = 4b, 物理 块 地 址 与 逻 
辑 块 地 址 相同 。 一 旦 编程 操作 中 产生 了 新 的 坏 
块 ,检索 出 可 用 的 块 地 址 作为 替代 块 ,对 替代 块 标 
记 当 前 使 用 的 逻辑 块 地 址 。 假 设 第 n 包 数 据 发 生 
页 编程 失败 , 则 第 n 包 数 据 第 一 次 编程 存放 的 地 
址 表达 式 为 : 
n=(A+1) +8 x64x(B,+1) +8x(C+1) 
(4) 
检测 到 该 地 址 编程 失败 ,调用 替代 块 进行 再 
次 编程 的 地 址 表达 式 为 : 
n=(A+1) +8x64x(B +1) +8x(C+1) 
(5) 
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其 中 B,,, 和 B, 的 逻辑 块 地 址 都 为 5.,。 

如 图 5 所 示 , 物 理 块 地 址 B 之 前 都 未 发 生 页 
编程 失败 ,直到 物理 块 地 址 下 的 CE3 单 片 Flash 
的 第 (n -3) /8 页 发 生 了 页 编程 失败 ,于 是 将 第 " 
包 数 据 再 次 编程 到 替代 块 中 ,可 见 替 代 块 的 物理 
块 地 址 为 8 +1( 假设 该 块 为 有 效 块 ) ,逻辑 块 地 址 
仍 为 5, 并 且 后 续 的 编程 操作 将 用 替代 块 代替 坏 
块 继续 进行 ,直到 该 逻辑 块 全 部 写 满 。 图 5 中 由 
8B 与 B+1 物理 块 组 合 而 成 的 逻辑 块 5, 无 缝 连接 
后 实际 上 相当 于 一 个 正常 块 ,根据 逻辑 块 地 址 寻 
址 读数 ,可 以 保证 B 物理 块 中 的 已 存 数据 不 于 
失 , 也 能 保证 流水 编程 操作 顺序 执行 。 

物理 块 地 址 B 逻辑 块 地 址 b 


物理 块 地 址 B+1 
逻辑 块 地址 b 上 Da_ | 


正常 写 入 区 

替代 块 空白 区 
编程 失败 页 
坏 块 无 数据 区 


图 5 坏 块 产生 时 存储 顺序 示意 图 


Fig.3 Storing order when invalid block occurs 
4 测试 结果 与 分 析 


4.1 时钟 频率 对 流水 编程 机 制 性 能 的 影响 
选取 4MHz ~ 64MHz 范围 内 的 常用 时 钟 频 
率 , 并 根据 向 Flash 发 送 指令 ` 地 址 以 及 加 载 数据 
所 需 周 期 计算 出 不 同时 钟 频率 下 a,b 的 取 值 。 
Samsung Electronics 给 出 的 NAND Flash 芯片 
测试 出 的 典型 自主 固化 时 间 为 300 +100 hs , 超 长 
自主 固化 时 间 最 大 值 为 700 js ”。 首 先 讨 论 自主 
固化 时 间 X; 不 出 现 超 长 固化 时 间 的 情况 下 流水 
编程 机 制 的 编程 速率 。 建 立 仿真 模型 并 采用 蒙特 
卡 洛 方法 ,该 方法 利用 重复 多 次 仿真 数据 的 方差 
来 代表 被 测 对 象 的 平均 水 平 , 合 X, 在 典型 值 
B00,400] hs 之 间 取 随机 值 ,多 次 测试 结果 如 图 
6 所 示 。 从 图 中 可 以 看 出 ,在 相同 频率 系统 时 钟 
下 ,采用 流水 编程 机 制 的 系统 比 普通 编程 机 制 所 
需 的 编程 时 间 明 显 减 少 ; 并 且 随 着 系统 时 钟 频 率 
的 提高 ,普通 编程 机 制 所 需 时 间 趋 于 平衡 ,但 流水 
编程 机 制 所 需 时 间 的 性 能 仍 有 较 大 优化 效果 。 
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时 钟 频率 /MHz 
6 ”典型 固化 时 间 对 上 比 图 
Fig.6 Typical storage time comparison 

下 面 讨论 编程 中 出 现 超 长 自主 固化 时 间 的 情 
况 。 如 图 7 所 示 , 在 普通 编程 机 制 中 , 出 现 超 长 自 
主 固化 时 间 将 直接 影响 整体 编程 速率 ,系统 所 用 
的 编程 时 间 将 随 着 出 现 超 长 固化 时 间 的 页 编程 个 
数 线性 增长 。 采 用 了 流水 编程 机 制 后 , 根据 式 
(2) 和 式 (4) ,在 一 个 流水 级 中 ,所 用 的 编程 时 间 
与 出 现 的 超 长 固化 时 间 的 页 编程 个 数 无 关 , 只 与 
式 (4) 取得 最 大 值 的 超 长 固化 时 间 有 关 。 得 出 结 
论 , 在 一 个 流水 级 中 , 当 出 现 一 个 或 多 个 超 长 固化 
时 间 , 流水 编程 机 制 比 普通 编程 机 制 所 需 编程 时 
间 明 显 减少 。 
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7 超 长 固化 时 间 对 比 图 


Fig.7 Overtime storage time comparison 


4.2 ” 坏 块 替代 处 理 机 制 测试 与 仿真 结果 

本 设计 选用 了 Xilinx 公司 型 号 为 Virtex 5 - 
xc5vlx85FPCA 硬件 平台 ,将 Flash 控制 器 模块 下 
载 到 可 编程 器 件 后 所 占用 逻辑 资源 为 7.5% "3 。 
进行 连接 CPU 数据 源 和 接收 器 等 单元 配合 的 板 
级 测试 ,利用 数据 源 进行 大 容量 数据 存储 测试 , 带 
历 所 有 Flash 存储 单元 、 多 次 测试 结果 见 表 1: 在 
频率 为 16MHz 的 系统 时 钟 下 ,验证 本 设计 的 存储 
系统 可 以 实现 的 平均 存储 速率 可 达 100MB/s 以 
上 。 存 取 数 据 对 上 比 结果 显示 , 本 设计 的 大 容量 存 
储 器 能 够 检测 出 已 知 坏 块 ,并 屏蔽 已 知 坏 块 ,并 在 
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新 坏 块 产生 时 调用 坏 块 处 理 机 制 , 保证 无 数据 丢 
失 , 实 现 数据 的 无 颖 连接 。 


表 1 平台 测试 统计 数据 


Tab.1 Data statistics in test bench 
逼 历次 数 。” ” 坏 块 个 数 平均 存储 速率 ( MB/s) 
1~10 43 125 
11 ~20 135 112 
21 ~30 201 116 
31 ~40 263 131 
5 结论 


流水 编程 机 制 使 得 存储 系统 的 整体 编程 速率 
大 幅度 提高 ,并 且 时 钟 频率 越 高 ,性 能 优化 程度 越 
高 ; 在 出 现 较 长 固化 的 特殊 情况 时 ,仍然 可 以 保证 
整体 编程 速度 优 于 普通 编程 机 制 。 提 出 了 无 缝 连 
接 式 坏 块 处 理 机 制 ,能 够 提供 一 个 完备 的 方案 实 
现 突 发 坏 块 时 对 数据 的 无 颖 处 理 , 改 善 了 常用 坏 
块 处 理 机 制 无 法 恢复 坏 块 数据 的 情况 ; 并 利用 逻 
辑 块 地 址 索引 进行 读 取 操 作 , 能 够 保证 无 丢失 无 
乱 序 地 存储 读 出 数据 ,使 得 整个 存储 系统 性 能 
完好 。 
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